Матрицы весов аминокислотных замен

Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку END4_ECOLI


ID   AP_endnuclease2; BLOCK
AC  IPB001719E; distance from previous block=(22,31)
   

DE   AP endonuclease, family 2
BL   ELV; width=47; seqs=85; 99.5%=2038; strength=1427

  Веб-страница, содержащая блок

 

  Здесь приведено выравнивание блока AP endonuclease, сделанное с помощью программы GeneDoc.
Голубым цветом раскрашены столбцы со степенью идентичности более 80%, зеленым цветом — более 60%, оранжевым цветом — более 40%, белым цветом — менее 40%. Пронумерован каждый пятый остаток.

 

Веса аминокислотных замен

Вычисление весов аминокислотных замен на основе множественного выравнивания блока AP_endnuclease2 из базы данных BLOCKS

Пара аминокислот nαβ Pαβ qα qβ sαβ
Met-Met 556 0,003971 0,015719 0,015719 8,012511
Met-Val 156 0,001114 0,015719 0,068429 -1,89860
Met-Asp 54 0,000386 0,015719 0,06734 -4,913334

   В таблице приведены значения количества пар аминокислот — nαβ, частоты встречаемости пар — Pαβ, средние частоты встречаемости отдельных аминокислот, входящих в пары — qα,qβ, вес замен аминокислот в парах друг на друга — sαβ . Количество пар было рассчитано с помощью программы pairs_cont.exe, остальные рассчеты производились по формулам:

Pαβ= ƒα β / Σα=120 Σβ=1 α ƒαβ,


qα(β)= P αα(ββ)+ Σα#β Pα β / 2,


sαβ= 2log2( Pαβ / qαqβ )

 

Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS

Пара аминокислот nαβ Pαβ qα qβ sαβ
Met-Met 464305 0,002026 0,019986 0,019986 4,685190
Met-Val 748759 0,003267 0,019986 0,066401 0,599616
Met-Asp 306465 0,001337 0,019986 0,044823 -0,843963

    Эта таблица ничем, кроме значений, не отличается от предыдущей, формулы, по которым производились рассчеты одинаковы. Единственное отличие — это гораздо большие значения количества пар, но это и понятно, т.к. рассчеты производились на основе 200 блоков, что в 200 раз больше одного блока :-)

 

Сравнение весов аминокислотных замен

Пара аминокислот Блок AP_endnuclease2 200 блоков BLOSUM62
Met-Met 8 5 5
Met-Val -2 1 1
Met-Asp -5 -1 -3

    В таблице приведены значения весов аминокислотных замен Met-Met, Met-Val, Met-Asp. Глядя на вес замен, можно оценить вероятность этих замен, то есть на сколько можно верить, что в процессе эволюции произошла именно такая замена. С помощью этих весов можно оценить на сколько гомологичны последовательности: чем больше суммарный вес замен, тем больше вероятность гомологичности последовательностей. В матрице BLOSSUM62 видно, что наибольший вес имеют замены внутри групп похожих аминокислот, а также замены аминокислот на самих себя, а замены между группами намного меньше (средний вес замен внутри группы I L V и F Y W — 2, вес замен между группами I L V и F Y W — -1.33, замены на самих себя — D на D — 6, Y на Y — 7). Действительно, более вероятно, что окажутся гомологичными аминокислоты из одной группы, чем из разных групп. Значения, полученые с помощью рассчетов на основе одного блока больше отличаются от BLOSSUM62, чем на основе 200 блоков ( в первом случае первые два значения отличаются на 3 единицы, третье на 2, во втором случае первые значения не отличаются, третье отличается на 2 единицы). Такие числа получились потому, что рассчеты проводились на основе разных по "качеству" и объему данных ( в одном блоке меньше выборка, следовательно увеличивается вероятность случайных данных; 200 блоков также намного меньшее кол-во, чем было обработано для построения матрицы BLOSSUM62). Исходя из этого, ясно, что самые правильные данные в BLOSSUM62, затем идут данные на основе 200 блоков; данным на основе AP_endnuclease2 можно верить меньше всего. Не смотря на все различия, везде можно видеть ту же закономерность, что и в BLOSSUM62.

 

На главную страницу второго семестра


©Сухорукова Мария,2005